多维正态分布

正态分布

二维正态分布

(X,Y)N(μ1,μ2,σ12,σ22,ρ)

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1σ1)22ρ(xμ1σ1)(yμ2σ2)+(yμ2σ2)2]}

二维正态分布的边缘正态分布 为一维 正态分布

使用协方差矩阵研究:
XN(μ1,σ12),YN(μ2,σ22)

C=(σ12ρσ1σ2ρσ1σ2σ22)|C|=σ12σ22(1ρ2)C1=1|C|(σ22ρσ1σ2ρσ1σ2σ12)x=(x1x2)μ=(μ1μ2)f(x1,x2)=12π|C|exp[12(xμ)TC1(xμ)]

n 维正态分布


AI 结构化补充(2026-05-02)

正态分布 多元高斯分布

二维正态分布

(X,Y)N(μ1,μ2,σ12,σ22,ρ)

f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1σ1)22ρ(xμ1σ1)(yμ2σ2)+(yμ2σ2)2]}

二维正态分布的边缘正态分布 为一维 正态分布

使用协方差矩阵研究:
XN(μ1,σ12),YN(μ2,σ22)

C=(σ12ρσ1σ2ρσ1σ2σ22)|C|=σ12σ22(1ρ2)C1=1|C|(σ22ρσ1σ2ρσ1σ2σ12)x=(x1x2)μ=(μ1μ2)f(x1,x2)=12π|C|exp[12(xμ)TC1(xμ)]

n 维正态分布

xRM,均值向量为 m,协方差矩阵为 V。当 V 对称正定时,M 维正态分布有普通密度

p(x)=1(2π)MdetVexp[12(xm)TV1(xm)].

这里 m=E[x]V=E[(xm)(xm)T]。系数中的 (2π)MdetV 是归一化因子,保证全空间积分为 1。若 V=I,各坐标是标准正态并且相互独立;若 V 是对角矩阵但对角元不全相同,各坐标仍独立,但方差不同。

独立性与非对角协方差

二维情形中,若 X,Y 独立,则联合密度分解为两个一维密度的乘积,协方差矩阵为

V=(σ1200σ22).

若二者不独立,相关性进入非对角协方差:

V=(σ12σ12σ12σ22),σ12=E[(Xμ1)(Yμ2)].

非对角项不只是符号修饰,它会在 (xm)TV1(xm) 中产生交叉项,改变等密度曲线的方向。直观上,一个变量的偏离会携带关于另一个变量偏离的信息。

向量形式与解相关

由于协方差矩阵 V 对称正定,可正交对角化为

V=QΛQT,Λ=diag(λ1,,λM),λi>0.

X=xm,Y=QTX.

(xm)TV1(xm)=XTQΛ1QTX=YTΛ1Y=i=1Myi2λi.

这一步把相关坐标旋转成不相关坐标。因为 Q 是正交矩阵,变量替换不改变体积元素;积分因此分裂为一维高斯积分的乘积:

RMeYTΛ1Y/2dY=i=1Meyi2/(2λi)dyi=(2π)MdetV.

这正好解释了密度公式中的归一化分母。

边界条件

普通密度要求 V 正定:所有特征值都严格大于 0,从而 detV>0V1 存在。若 V 奇异,分布只集中在某个低维仿射子空间上,是退化正态分布;此时不能把上面的公式当作相对于 M 维 Lebesgue 测度的普通 pdf 来写。实际使用中还要区分“不相关”和“独立”:对联合正态变量二者等价,但对一般分布并不等价。